AI资讯新闻榜单内容搜索-LLM

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: LLM
ICML 2026 | Agentic强化学习训练的信息自锁问题

ICML 2026 | Agentic强化学习训练的信息自锁问题

ICML 2026 | Agentic强化学习训练的信息自锁问题

随着大语言模型逐步从「单轮问答」走向「真实环境中的持续交互」,LLM agents 正在被用于越来越复杂的 agentic applications:deep research、coding、computer use、customer service、medical inquiry、troubleshooting 等等。

来自主题: AI技术研报
5880 点击    2026-06-17 14:05
BudgetMem:给Runtime Agent Memory装上「预算路由器」,让记忆系统学会按需分配运行成本

BudgetMem:给Runtime Agent Memory装上「预算路由器」,让记忆系统学会按需分配运行成本

BudgetMem:给Runtime Agent Memory装上「预算路由器」,让记忆系统学会按需分配运行成本

当 LLM Agent 处理长期对话、多轮交互和复杂文档时,Memory 已经成为不可或缺的核心模块。它帮助智能体保存历史、检索信息、维持个性化上下文,并支撑跨时间的推理能力。

来自主题: AI技术研报
8404 点击    2026-06-15 09:20
Anthropic宣告「递归自我提升」时代到来,LLM如何实现自我进化?全景综述带你一探究竟

Anthropic宣告「递归自我提升」时代到来,LLM如何实现自我进化?全景综述带你一探究竟

Anthropic宣告「递归自我提升」时代到来,LLM如何实现自我进化?全景综述带你一探究竟

近日,Anthropic 发布了一篇引发广泛关注的文章《When AI builds itself》。文中披露了极其惊人的内部数据:截至 2026 年 5 月,Anthropic 超过 80% 的合并代码已由 Claude 编写,工程师的日常代码产出飙升了 8 倍;更令人瞩目的是,AI 智能体已经可以自主提出假设、执行长达数百小时的强化安全实验。

来自主题: AI技术研报
10299 点击    2026-06-12 10:13
刚刚,Anthropic道歉了

刚刚,Anthropic道歉了

刚刚,Anthropic道歉了

压力之下,刚刚,《连线》记者 Max Zeff 爆料称,Anthropic 正在撤销这一政策。该媒体从 Anthropic 获得了一份声明,其中写到:「我们正在调整 Fable 5 针对前沿 LLM 开发的安全限制,使其变得可见。」

来自主题: AI资讯
9238 点击    2026-06-11 15:02
斩获15个顶级零日漏洞:0G Lab联合新国立,北大和北邮团队构建的共识协议debug智能体框架

斩获15个顶级零日漏洞:0G Lab联合新国立,北大和北邮团队构建的共识协议debug智能体框架

斩获15个顶级零日漏洞:0G Lab联合新国立,北大和北邮团队构建的共识协议debug智能体框架

分布式系统的 “圣杯”—— 共识协议(Consensus Protocols),长久以来都是顶级基础设施工程师的 “Bug 地狱”。由于其状态极其复杂、多节点交织,传统测试和单体 LLM 对硬核的 Deep Bug(深层逻辑漏洞)几乎束手无策。

来自主题: AI技术研报
7939 点击    2026-06-11 14:59
一篇综述看懂 agent context compression:怎么压、压什么、谁来压

一篇综述看懂 agent context compression:怎么压、压什么、谁来压

一篇综述看懂 agent context compression:怎么压、压什么、谁来压

LLM Agent 做长任务时,真正让人头疼的往往不是模型不会推理,而是上下文开始失控:前几步还很清楚,后面就忘约束、丢状态、重复试错,最后把任务跑成事故现场。

来自主题: AI技术研报
6802 点击    2026-06-11 14:32
万人内测,科研神器Mira爆火!4h肝出论文初稿,全自动接管科研

万人内测,科研神器Mira爆火!4h肝出论文初稿,全自动接管科研

万人内测,科研神器Mira爆火!4h肝出论文初稿,全自动接管科研

还在手动在不同工具间来回切换查文献、跑代码、看结果?两个月前发起内侧的科研龙虾SciClaw,经过上万名科研人的「考核」,正式升级为Mira,推出专家小队、科研画布、LLM WIKI 三大核心能力,首次将「Vibe Researching」理念产品化,让研究者像组建实验室团队一样配置 AI,把时间还给真正的科学思考。

来自主题: AI资讯
9250 点击    2026-06-10 11:48
图灵奖得主Sutton新作:AI的下一步,是走向「生成认知」

图灵奖得主Sutton新作:AI的下一步,是走向「生成认知」

图灵奖得主Sutton新作:AI的下一步,是走向「生成认知」

从 LLM 的超长文本处理、视频生成模型的以假乱真、Agent 自主规划与执行的日趋成熟,到 VLA、世界模型等开始进入物理世界,AI 正在不断拓宽其能力边界。

来自主题: AI技术研报
6621 点击    2026-06-02 15:05
Speech LLM 的下一个突破口:你的语音大模型可以是个「带韵律的文本模型」

Speech LLM 的下一个突破口:你的语音大模型可以是个「带韵律的文本模型」

Speech LLM 的下一个突破口:你的语音大模型可以是个「带韵律的文本模型」

相信大家都有过这样的体验:同一个系列的模型,使用文本交互的时候,模型就像开启了 “最强大脑”,数学代码等各种复杂推理任务样样精通,可是一旦将其改造成语音对话模型之后,性能就猛烈下降,严重 “降智”,经常会犯很多基本的逻辑错误。

来自主题: AI技术研报
6079 点击    2026-05-28 14:51
告别多奖励跷跷板:Flow-OPD将多教师OPD带入图像生成

告别多奖励跷跷板:Flow-OPD将多教师OPD带入图像生成

告别多奖励跷跷板:Flow-OPD将多教师OPD带入图像生成

今年以来,在线策略蒸馏 OPD(On-Policy Distillation)已经逐渐成为大厂 LLM 后训练中的重要组件,例如 DeepSeek-V4,GLM5 就使用了多教师 OPD 来整合不同领域专家模型的能力,相比混合奖励强化学习收敛更快、效果更好。

来自主题: AI技术研报
7178 点击    2026-05-26 10:07